repeatmasker-usage

RepeatMasker使用

2018-05-03注 若安装报错 参考该博客安装

:https://blog.csdn.net/woodcorpse/article/details/73148464

Installation

  1. RMblast

# RMBlast install
wget  ftp://ftp.ncbi.nlm.nih.gov/blast/executables/rmblast/2.2.28/ncbi-rmblastn-2.2.28-src.tar.gz
# compiled with g++ compiler
tar zxvf ncbi-rmblastn-2.2.28-src.tar.gz #解压
cd ncbi-rmblastn-2.2.28-src/c++/
./configure --with-mt --prefix=$SFTW/app/rmblastn --without-debug
make -j8 && make install #make 的时间很长 30min左右

  1. TRF 安装

wget http://tandem.bu.edu/trf/downloads/trf409.linux64
chmod a+x trf409.linux64
mv trf409.linux64 $SFTW/bin/trf

  1. RepeatMasker 安装

wget http://www.repeatmasker.org/RepeatMasker-open-4-0-6.tar.gz
tar zxvf|cd
mv to $SFTW/app

下载最新数据库(http://www.girinst.org/),需要账号登陆,下载完后传到服务器
解压并替换掉RepeatMasker/Libraries/

#下载Dfam数据库:
wget http://www.dfam.org/web_download/Release/Dfam_2.0/Dfam.hmm.gz
#我用wget下载失败 自己下载hou传到服务器
解压到RepeatMasker/Libraries/

cd $SFTW/app/RepeatMasker
./configure
#按照提示输入程序路径(主要是rmblast的路径)
#安装成功!
#创建软连接,注意一定要用绝对路径
ln -s $SFTW/app/RepeatMasker/RepeatMasker $SFTW/bin

USAGE

from biostars:

RepeatMasker -nolow -no_is -norna -parallel 1 \
-lib /data/tanhao/lib/RepeatMasker/Libraries/RepeatMasker.lib genome.fa >repeatmask.log 2

个人总结参数问题:

-nolow 不识别low_complex 不识别简单序列 -species ""引号括起来的物种名可以用空格 -lib 指定自定义数据库后,仍会在默认库中搜索,优先级是怎么样的?自定义库的搜索结果会在结果中展示么?